AI资讯新闻榜单内容搜索-LLaMA

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

让 Llama 2 在 Windows 98 奔腾 2（Pentium II）机器上运行，不但成功了，输出达到 39.31 tok / 秒。

来自主题: AI资讯

9440 点击 2024-12-30 15:15

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

o1完整版公开仅10天，Scaling Law新范式就被逆向工程复现了！

来自主题: AI技术研报

6810 点击 2024-12-17 17:12

微软出招！新模型数学超GPT-4o编程胜Llama3.3，训练新范式引热议：midtraining

OpenAI谷歌天天刷流量，微软也坐不住了，推出最新小模型Phi-4。参数量仅14B，MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。

来自主题: AI技术研报

8722 点击 2024-12-13 15:14

新版Llama 3 70B反超405B！Meta开卷后训练，谷歌马斯克都来抢镜

OpenAI“双12”刚进行到第二天，就把大模型圈搅得好不热闹！一边是Meta没预告就发布了Llama 3.3，70B版本就能实现以前405B的性能。

来自主题: AI资讯

8523 点击 2024-12-07 15:29

Claude Artifacts的开源实现，Llama3驱动的AI程序员，瞬间做一个软件还能实时渲染。

Llamacoder是Claude Artifacts的开源实现。最大的亮点就是，左侧AI写代码，右侧实时渲染。之前给大家推荐过一个基于Claude做的，Llamacoder是用了Meta 的 Llama 3.1 405B 作为底层语言模型。

来自主题: AI资讯

8443 点击 2024-12-01 11:55

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

开源模型阵营又迎来一员猛将：Tülu 3。它来自艾伦人工智能研究所（Ai2），目前包含 8B 和 70B 两个版本（未来还会有 405B 版本），并且其性能超过了 Llama 3.1 Instruct 的相应版本！长达 73 的技术报告详细介绍了后训练的细节。

来自主题: AI技术研报

12073 点击 2024-11-23 16:04

多模态竞技场对标90B Llama 3.2！Pixtral 12B技术报告全公开

以开源极客之姿杀入江湖的Mistral AI，在9月份甩出了自家的首款多模态大模型Pixtral 12B，如今，报告之期已至，技术细节全公开。

来自主题: AI技术研报

7074 点击 2024-11-19 17:15

深度揭秘CoT！普林斯顿耶鲁发布最新报告：大模型既有记忆推理、也有概率推理

研究人员通过案例研究，利用大型语言模型（LLMs）如GPT-4、Claude 3和Llama 3.1，探索了思维链（CoT）提示在解码移位密码任务中的表现；CoT提示虽然提升了模型的推理能力，但这种能力并非纯粹的符号推理，而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报

4490 点击 2024-11-13 09:07

使用 Swarm 构建多智能体新闻助理

本文将带你构建一个多智能体新闻助理，利用 OpenAI 的 Swarm 框架和 Llama 3.2 来自动化新闻处理工作流。在本地运行环境下，我们将实现一个多智能体系统，让不同的智能体各司其职，分步完成新闻搜索、信息综合与摘要生成等任务，而无需付费使用外部服务。

来自主题: AI技术研报

6096 点击 2024-11-06 09:44

万亿市场！开源AI大模型发展研究报告 2024

随着开源技术占据各大新兴领域的技术路线，其不断丰富人工智能领域的应用场景。 2023年，Meta 相继发布 Llama 和 Llama2，很快成为广受欢迎的开源大模型，也成为许多模型的基座模型。

来自主题: AI技术研报

7439 点击 2024-11-03 11:09

AI资讯新闻榜单内容搜索-LLaMA

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

微软出招！新模型数学超GPT-4o编程胜Llama3.3，训练新范式引热议：midtraining

新版Llama 3 70B反超405B！Meta开卷后训练，谷歌马斯克都来抢镜

Claude Artifacts的开源实现，Llama3驱动的AI程序员，瞬间做一个软件还能实时渲染。

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

多模态竞技场对标90B Llama 3.2！Pixtral 12B技术报告全公开

深度揭秘CoT！普林斯顿耶鲁发布最新报告：大模型既有记忆推理、也有概率推理

使用 Swarm 构建多智能体新闻助理

万亿市场 ！开源AI大模型发展研究报告 2024

万亿市场！开源AI大模型发展研究报告 2024